iT邦幫忙

2023 iThome 鐵人賽

DAY 9
0
Software Development

30天來打造一個方便的訂房機器人系列 第 9

[Day 09]selenium取得網頁資訊

  • 分享至 

  • xImage
  •  

1. 前往我們想要蒐集資料的網站

driver = webdriver.Edge()
driver.get("https://www.booking.com/searchresults.zh-tw.html?ss=%E5%8F%B0%E5%8C%97&checkin=2023-10-10&checkout=2023-10-12&group_adults=2&no_rooms=1&group_children=0")

沒錯還是那個booking,可以藉由這次觀察一下,beautifulsoup跟selenium的差別

2. 使用find_element找到想要取得的標籤

titles = driver.find_elements(By.CSS_SELECTOR, 'div[data-testid="title"]')

這邊要注意,如果想要尋找的標籤是動態產生出來的話,就需要用到這種By.CSS_SELECTOR

3. 將得到的titles拆開成各個title

for title in titles:
    print(titles.text)

https://ithelp.ithome.com.tw/upload/images/20230927/20161505drJiB7nOOP.png
啊哈!!!成功啦

下一篇來告訴你另一個方法去搜尋


上一篇
[Day 08]selenium小應用
下一篇
[Day 10]seleium的XPath用法
系列文
30天來打造一個方便的訂房機器人30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言